Revisión de artículos: seguimiento de instrucciones, alineación segura y Agentic RAG
Se explican nuevos trabajos sobre evaluación del seguimiento de instrucciones (FireBench), resolución teórica de la alineación RLHF, estabilidad de representaciones internas y sistematización de Ag...